Interpretación de Resultados

Cómo leer una tabla de regresión

Danilo Freire

Emory University

29-08-2024

Puntos clave para esta clase

  • Estimando (lo que queremos saber)

  • Estimador (procedimiento aplicado a los datos)

  • Estimación (producida por ese procedimiento)

  • Error estándar y tipo

  • Valor \(p\)

  • Tamaño de la muestra

  • Clusters

  • Bloques

  • Media del grupo de control

  • Interpretar:

    • Coeficiente de los tratamientos
    • Coeficiente de los términos de interacción

Regresión 📈

Regresión

\[ Y_i = \alpha_0 + \alpha_1 T_i + \epsilon_i\]

  • Una técnica para estimar la relación entre una variable de resultado y variables predictoras.

  • A menudo proponemos y estimamos una relación lineal porque la regresión sin covariables está estrechamente relacionada con la diferencia de medias.

Algunas ecuaciones de regresión

Diversas formas de especificar un modelo

\[ Y_i = \alpha_0 + \alpha_1 T_i + \epsilon_i\]

\[ Y_i = \gamma_0 + \gamma_1 T_i + \gamma_2 X_i + \upsilon_i\]

\[ Y_i = \delta_0 + \delta_1 T_i + \delta_2 X_i + \delta_3 T_iX_i + \zeta_i\]

  • Resultado: \(Y_i\)
  • Tratamiento: \(T_i\)
  • Covariable: \(X_i\)

Componentes principales de una tabla de regresión 📋

El estudio

El estudio

  • Migración rural-urbana en India.

  • Posibles explicaciones para la baja integración política de los migrantes internos:

  • Fuertes vínculos con la región de origen

  • Barreras burocráticas

  • Exclusión por residentes locales y élites

  • Tratamiento (binario): campaña puerta a puerta para facilitar el registro de votantes de migrantes internos.

  • Tres indicadores de integración política.

Tabla

  • Cada columna es una regresión diferente y tiene un resultado (indicador) diferente.

La tabla

  • Para cada columna

\(Y_i = \widehat{\alpha}_0 + \widehat{\alpha}_1 T_i\)

  • Sin covariables

Variable de resultado

  • Valores de VD (variable dependiente) = {0,1}

El estimando

  • El estimando es el efecto de intención de tratar (ITT, el efecto de la asignación al tratamiento = oferta de ayuda en el registro de votantes).

El estimador

  • El estimador es la regresión por mínimos cuadrados ordinarios (OLS).

Efecto de intención de tratar (ATE de la oferta de ayuda)

  • Estimación del efecto de intención de tratar sobre si un migrante tiene una tarjeta de identificación de votante basada en la ciudad: 0,243.

Errores estándar robustos

  • Error estándar de esta estimación: 0,019.

Media del grupo de control

  • % de migrantes sin tratamiento que tienen una tarjeta de identificación de votante basada en la ciudad: 0,161.

Media del grupo de control

A veces verás

Has City-based
Voter ID
———– ——————
Treatment 0.243
(0.019)
Intercept 0.161
(s.e.)
  • Con un grupo de tratamiento y un grupo de control, sin covariables: intercepto = media del grupo de control.

Valor \(p\)

  • Valor \(p\) (límite superior): \(p< 0,001\)

Tamaño de la muestra (\(n\))

  • Observaciones (\(n\)) = 2120

Regresión con covariables

  • ¿Cuál es la estimación del ITT en el primer resultado?
  • ¿Es diferente de la estimación del ITT sin covariables?

Regresión con covariables

  • \(Y_i = \gamma_0 + \gamma_1 T_i + \gamma_2 X_i + \upsilon_i\)

  • Estimación del ITT: \(\widehat{\gamma}_1\) = 0,236

Coeficientes de las covariables

  • Generalmente puedes ignorar los coeficientes de las covariables. Ni siquiera se informan aquí.

  • Si se informan, no los interpretes como el efecto causal de la covariable.

Regresión con términos de interacción

Regresión con términos de interacción

\[Y_i = \widehat{\delta}_0 + \widehat{\delta}_1 T_i + \widehat{\delta}_2 \text{EducPrim}_i + \widehat{\delta}_3 T_i\cdot\text{EducPrim}_i\]

  • A menudo usamos regresiones con términos de interacción cuando queremos estimar el ATE para diferentes subconjuntos de unidades (efecto promedio del tratamiento condicional, CATE).

  • Por ejemplo: El ATE para personas que han completado la educación primaria y el ATE para personas que no han completado la educación primaria.

Regresión con términos de interacción

\[Y_i = \widehat{\delta}_0 + \widehat{\delta}_1 T_i + \widehat{\delta}_2 \text{EducPrim}_i + \widehat{\delta}_3 T_i\cdot\text{EducPrim}\]

  • Promedio \(Y_i\) si \(T_i=0\) y \(EducPrim_i=0\) : \(\widehat{\delta}_0\)

  • Promedio \(Y_i\) si \(T_i=1\) y \(EducPrim_i=0\) : \(\widehat{\delta}_0 + \widehat{\delta}_1\)

  • Promedio \(Y_i\) si \(T_i=0\) y \(EducPrim_i=1\) :

  • Promedio \(Y_i\) si \(T_i=1\) y \(EducPrim_i=1\) :

Regresión con términos de interacción

Regresión con términos de interacción

Regresión con términos de interacción

Con \(Muslim_i=0\), \(SC/ST_i=0\), \(HighIncome_i=0\), and \(LongTermMigrant_i=0\):

  • \(Y_i = \delta_0 + \delta_1 T_i + \delta_2 X_i + \delta_3 T_iX_i + \zeta_i\)

  • \(Y_i = \delta_0 + \widehat{\delta}_1 T_i + \widehat{\delta}_2 \text{PrimEduc}_i + \widehat{\delta}_3 T_i\cdot\text{PrimEduc}\)

  • \(Y_i = 0.149 + 0.248 T_i - 0.058 \text{PrimEduc}_i + 0.083 T_i\cdot\text{PrimEduc}_i\)

Regresión con términos de interacción

\[Y_i = 0.149 + 0.248 T_i - 0.058 \text{PrimEduc}_i + 0.083 T_i\cdot\text{PrimEduc}_i\]

  • ¿Cuál es el efecto promedio del tratamiento (ATE) para \(EducPrim_i=0\)?

  • ¿Cuál es el efecto promedio del tratamiento (ATE) para \(EducPrim_i=1\)?

  • ¿Son estos efectos promedio del tratamiento condicionales diferentes?

Efectos promedio del tratamiento condicionales

¿Son estos efectos promedio del tratamiento condicionales diferentes?

Aleatorización por clusters

Segundo tratamiento en el estudio de India

  • Posibles explicaciones para la baja integración política de los migrantes internos:

  • Fuertes vínculos con la región de origen

  • Barreras burocráticas \(\rightarrow T1\)

  • Exclusión por residentes locales y élites \(\rightarrow T2\)

  • Aproximadamente 2000 personas alrededor de 87 centros de votación en 4 bloques: Delhi/Lucknow * por encima/debajo de la mediana del número de sujetos experimentales en el centro de votación

Segundo tratamiento en el estudio de India

  • Cartas, mensajes de WhatsApp y correos electrónicos en 2-4 semanas antes de la elección al diputado titular, candidatos a diputados y otros funcionarios locales informándoles que se había llevado a cabo recientemente una campaña de registro de votantes entre migrantes.

Los resultados

  • Índice = promedio de puntuaciones \(z\)

  • Puntuación \(z\) para el indicador \(k\) para el individuo \(i\): \(z_i^k\) = (\(y_i^k\) - media del grupo de control) / desviación estándar del grupo de control

Unidades y clusters

  • Número de observaciones =

  • Número de clusters =

El estimador

  • Estimador: mínimos cuadrados ponderados, con clusters ponderados por igual, con efectos fijos por bloque y covariables individuales.

Errores estándar robustos por cluster

Estimación

  • ¿Cuál es el efecto promedio estimado de \(T2\) en el índice de resultados?

Prueba de hipótesis

  • ¿En qué componentes del índice tiene \(T2\) un efecto estadísticamente significativo?

Interpretación

  • ¿Estos resultados son positivos o negativos para los migrantes internos?